توسعه روشهای مبتنی بر فرض توزیع غیرگوسی برای بهسازی گفتار

پایان نامه
چکیده

با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی، کارهای بسیاری در زمینه بهسازی و بازشناسی گفتار صورت گرفته که در همه این کاربردها وجود نویز و پژواک باعث کاهش کارآیی سیستم های گفتاری می شود. تاکنون تعداد زیادی از الگوریتم های بهسازی گفتار براساس تخمین دامنه طیف سیگنال گفتار و هم چنین تخمین ضرایب حقیقی و موهومی طیف گفتار مبتنی بر معیار mmse و map و با فرض گوسی بودن مولفه های دکارتی ضرایب dft سیگنال گفتار ارائه شده اند. در سال های اخیر محققان به دنبال واردکردن مدل های احتمالاتی دقیق تری برای مولفه های دکارتی ضرایب dft سیگنال گفتار هستند . در این پایان نامه، ابتدا به بررسی سیستم های تک کاناله تخمین دامنه سیگنال تمیز با فرض گوسی بودن مولفه های دکارتی ضرایب dft سیگنال گفتار و هم چنین سیستم تک کاناله تخمین مولفه های دکارتی ضرایب سیگنال تمیز با همان فرض گوسی بودن ضرایب می پردازیم . در ادامه نگاهی به سیستم های بهسازی که مبتنی برفرض غیرگوسی برای مولفه های دکارتی ضرایب dft سیگنال گفتار هستند، داریم . در این زمینه، نخست به کمک معیار kullback به دنبال تابع توزیعی هستیم که بر هیستوگرام دامنه گفتار منطبق شود . در این راستا با استفاده از توزیع سوپرگوسین و با تغییر پارامترهایش از نظر معیار kullback به توزیع نمایی رسیدیم که بر هیستوگرام دامنه گفتار منطبق تر است و تخمین گر دامنه طیف سیگنال گفتار را با فرض توزیع نمایی برای دامنه گفتار براساس معیار mmse بدست آوردیم . در ادامه این پایان نامه ، روش تخمین مرتبه متغیر mmse با فرض سوپرگوسین بودن دامنه گفتار را مورد بازنگری قرار داده و تخمین گرهای جدید را استخراج می کنیم. شبیه سازی ها نشان می دهند که با در نطرگرفتن توزیع نمایی برای دامنه گفتار نسبت به حالتی که ضرایب توزیع لاپلاس یا گوسی دارند بهسازی بیشتری از نظر معیار segsnr بدست می آید .

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بهسازی گفتار با تخمین گر کمترین میانگین مربعات خطا برپایه توزیع مخلوط لاپلاس برای گفتار

In this paper an estimator of speech spectrum for speech enhancement based on Laplacian Mixture Model has been proposed. We present an analytical solution for estimating the complex DFT coefficients with the MMSE estimator when the clean speech DFT coefficients are mixture of Laplacians distributed. The distribution of the DFT coefficients of noise are assumed zero-mean Gaussian.The drived MMSE...

متن کامل

بهسازی گفتار با تخمین گر کمترین میانگین مربعات خطا برپایه توزیع مخلوط لاپلاس برای گفتار

در این مقاله یک روش بهسازی گفتار آماری با فرض توزیع مخلوط لاپلاس برای گفتار، برای تخمین سیگنال گفتار تمیز (بدون نویز) از سیگنال گفتار نویزی ارائه شده است. در روش پیشنهادی، ضرایب تبدیل فوریه زمان کوتاه گسسته سیگنال گفتار با استفاده از تخمین گر کمترین میانگین مربعات خطا، بدست می آید. در این تخمین، فرض می شود که تابع چگالی احتمال ضرایب تبدیل فوریه سیگنال تمیز و نویز به ترتیب، مخلوط لاپلاس و گوسی ب...

متن کامل

بهسازی گفتار مبتنی بر روش ترکیبی تفاضل طیفی و برنامه نویسی ژنتیک

در بیشتر محیط های زندگی، نویزهای مختلفی حضور دارد که داده های صوتی را تخریب می کند. در این مقاله روشی را معرفی می کنیم که در آن با استفاده از برنامه نویسی ژنتیک، نویز افزوده شده به داده های صوتی کاهش داده می شود تا داده های با کیفیت بهتری به دست آید. به این منظور ترکیب دو روش تفاضل طیفی و برنامه نویسی ژنتیک برای بهسازی گفتار پیاده سازی شده است. در این روش در مرحله اول، نویز به روش تفاضل طیفی کا...

متن کامل

بهسازی وفقی سیگنال گفتار در محیط‌های واقعی با استفاده از ساختار ترکیبی مبتنی بر شکل‌دهنده‌های پرتو و فیلتر پسینه

تنوع میدان‌های نویزی حاکم بر محیط‌های واقعی، طراحی سیستم واحدی را که قادر به حذف کامل همه اغتشاشات محیطی باشد، با مشکل مواجه می‌کند. لذا، داشتن یک شناخت اولیه از میدان‌های نویزی موجود در محیط و بررسی نوع اثر هر یک بر روی سیگنال گفتار، گام مؤثری در جهت فرآیند بهسازی محسوب می‌شود. در این مقاله، ضمن بررسی نویزهای اساسی موجود در زمینه گفتار ضبط‌شده در شرایط واقعی، به ارزیابی میدان‌های نویزی پایین‌گ...

متن کامل

استخراج ویژگی‌های مبتنی بر مدل‌سازی خطی تراژکتوری گفتار جاسازی شده در فضای بازسازی شده فاز برای سیستم بازشناسی گفتار

تحقیقات اخیر نشان می‌دهد که تظاهرات غیرخطی و آشوبی سیگنال گفتار می‌تواند در حوزة فضای بازسازی شده فاز (RPS) مطالعه شود. تئوری جاسازی برمبنای محورهای تأخیری، ابزار مناسبی برای بررسی تراژکتورهای گفتاری در RPS است. تاکنون از مشخصه‌های تراژکتورهای گفتاری به ندرت در سیستم‌های کاربردی بازشناسی گفتار استفاده شده است. از اینرو در این مقاله  روش استخراج ویژگی جدیدی براساس پارامترهای مدلسازی خطی مبتنی بر...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023